課程資訊
課程名稱
電腦輔助翻譯
Corpus-assisted Translation 
開課學期
112-2 
授課對象
文學院  外國語文學系  
授課教師
高照明 
課號
FL3233 
課程識別碼
102 50620 
班次
 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期二5,6,7(12:20~15:10) 
上課地點
外教104 
備註
本課程中文授課,使用英文教科書。
總人數上限:25人 
 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

本課程介紹如何利用科技改善翻譯的品質與速度,內容包括電腦輔助翻譯的原理,英漢平行語料庫的建立﹑單語及平行語料庫的檢索﹑中英文術語的擷取﹑雙語句子的對齊﹑翻譯記憶系統﹑搭配語的擷取﹑及如何利用可比語料庫與各種數位工具來協助翻譯。各週進度如下。
1電腦輔助翻譯概述,如何利用ChatGPT, Google Bard, Google Translate 及DeepL機器翻譯系統於前編輯及後編輯﹑如何運用平行語料Linguee及單語語料Netspeak於翻譯實務。
2翻譯記憶系統使用的時機與流程﹑如何利用Omega T建立翻譯記憶並利用翻譯記憶於翻譯實務。如何利用術語庫。
3雲端電腦輔助翻譯軟體MateCat的功能。翻譯記憶的格式(TMX)。模糊比對的原理。如何在Colab上利用grep檢索翻譯記憶。
4 如何用Netspeak與 Linguee來驗證Google Translate 和DeepL的答案是否正確
5 單語語料庫的建置與檢索I:Concordances, Word List, Ngrams(AntConc)。
6. 語料庫的建置與檢索II Keyword List, Collocates(AntConc)及背後的統計。
7 語料庫的建置與檢索III 中文分詞 SegmentAnt+AntConc。Google Colab程式。
8 語料庫的建置與檢索IV 英文詞性標記程式TagAn + AntConc。Google Colab程式。
9 Regular Expressions。詞組與術語的擷取。AntConc,Cuda Text, NLTK, Spacy.
10 平行語料庫的建置 (LF Aligner, AntPConc, CUC_ParaConc)。
11 利用ChatGPT, Google Bard, 和提示工程將翻譯自動化(I)
12 利用ChatGPT, Google Bard, 和提示工程將翻譯自動化(II)
13 從平行語料庫擷取雙語詞彙﹑術語﹑及搭配語 。
14 可比語料庫的建置與檢索
15 Term Project實做 

課程目標
修課的學生經過一學期的訓練之後能夠將數位工具與翻譯實務結合。知道為何,如何,及何時該使用什麼工具和方法來增進翻譯的品質和速度。在哪些地方可以收集到翻譯資源,以及如何將這些翻譯資源轉成翻譯記憶,並用於電腦輔助翻譯系統。學生修完課之後將熟悉相關的數位工具的步驟及背後的原理。 
課程要求
課程內容已錄製免費線上課程並上傳中華教育開放平台 https://www.openedu.tw/course.jsp?id=1342
如果同學忘記工具或程式如何操作,請觀看上課投影片及課程講解錄影。
1上課出席率10%
2作業: 60% (以下每一項佔總分6分)
(1)利用Google Translate 及DeepL機器翻譯系統於前編輯及後編輯。
(使用之數位工具及技術:Google Translate + DeepL機器翻譯系統。翻譯策略:前編輯及之+後編輯)
(2)運用雙語平行語料庫Linguee, Jukuu, 和我們所開發的中英雙語檢索程式,以及單語語料庫Netspeak於翻譯實務。
(使用之數位工具及技術:雙語平行語料庫之檢索Linguee + Jukuu + 我們所開發的中英雙語檢索程式 + 單語語料庫Netspeak 。翻譯策略:將整句翻譯的問題切割成幾個可以透過雙語平行語料庫及單語語料庫檢索得到答案的小問題)
(3)利用Omega T建立翻譯記憶及術語庫並運用翻譯記憶於翻譯實務。
(使用之數位工具及技術:Omega T電腦輔助翻譯系統+翻譯記憶+術語庫。翻譯策略:根據翻譯記憶中最接近的例句來修改並透過語料庫工具驗證。)
(4)利用AntConc 中Concordances, Word List, Ngrams, Keyword List, Collocates, regular expressions等功能於翻譯實務。
(使用之數位工具及技術:運用AntConc文本分析軟體找出文本的特徵。翻譯策略:依據文本的特徵來進行翻譯或作為翻譯佐證)
(5)利用LF Aligner建置句對齊之雙語平行語料庫並用AntPConc或 CUC_ParaConc檢索雙語語料。
(使用之數位工具及技術:LF Aligner+AntPConc+CUC_ParaConc。翻譯策略:建立翻譯資源)
(6)利用英文詞性標記程式TagAnt , AntConc, CudaText 中Regular Expressions功能擷取英文名詞組並用Colab程式呼叫Google Translate擷取名詞組翻譯。
(使用之數位工具及技術:TagAnt + AntConc + CudaText + Regular Expressions 擷取名詞組+ 呼叫Google Translate擷取名詞組翻譯。翻譯策略:自動取得名詞組翻並根據語料庫的資料修改答案)
(7)運用中文分詞及詞性標記程式擷取中文關鍵詞組。
(使用之數位工具及技術:自動中文分詞 +自動詞性標記程式 + 自動擷取中文關鍵詞組 + 呼叫Google Translate自動擷取中文關鍵詞組的英文翻譯。翻譯策略:自動取得中文關鍵詞組的英文翻譯並根據語料庫的資料修改答案)
(8)呼叫Colab中文以及英文分句程式並呼叫Google Translate取得翻譯。
(9)呼叫Colab英文術語自動擷取程式並呼叫Google Translate取得翻譯。
(10)利用Colab雲端程式建置可比語料庫並用於翻譯實務。
(11)利用grep檢索語料或TMX資料中的翻譯。

3口頭報告: 10% 需包括作業中所涵蓋的數位工具至少6項以上。
4期末書面報告: 20%需包括作業中所涵蓋的數位工具至少6項以上。 
預期每週課後學習時數
 
Office Hours
另約時間 
指定閱讀
 
參考書目
Gao, Zhao-Ming. (2011) "Exploring the effects and use of a Chinese–English parallel concordancer." Computer-assisted Language Learning, Vol. 24, No. 3, pp. 255-275.

Gao, Zhao-Ming. (2014). ‘Automatic extraction of English collocations and their Chinese-English bilingual examples: a computational tool for bilingual lexicography’. Concentric Studies in Linguistics, Vol. 40, No. 1, pp. 95-121.

Gao, Z.M. and Chiou, S.-H. (2018). Computer-aided Translation. In Shei, C. and Gao, Z.-M. (eds.). The Routledge Handbook of Chinese Translation, pp. 485.-505.

Gao, Zhao-Ming. (2021). ‘Automatically Compiling Bilingual Legal Glossaries Based on Chinese-English Parallel Corpora’ In Saihong Li and William Hope (eds.) Terminology Translation in Chinese Contexts: Theory and Practice. London and New York: Routledge.

Jacquemin, Christian. (2001). Spotting and Discovering Terms through Natural Language Processing. MIT Press.

Koehn, Philipp (2010) Statistical Machine Translation. Cambridge University Press.

Mikhailov, Mikhail and Cooper, Robert. (2016). Corpus Linguistics for Translation and Contrastive Studies: A Guide for Research. Routledge.

Olohan, Maeve. (2014). Introducing Corpora in Translation Studies. Routledge.

Quah, Chiew Kin. (2005). Translation and Technology. Palgrave Macmillan.

Shei, C. and Gao, Z.-M. (eds.). (2018). The Routledge Handbook of Chinese Translation. Routledge.

Zanettin, Federico. (2012). Translation-driven Corpora: Corpus Resources for Descriptive and Applied Translation Studies. St. Jerome Publishing. 
評量方式
(僅供參考)
   
針對學生困難提供學生調整方式
 
上課形式
以錄影輔助, 提供學生彈性出席課程方式
作業繳交方式
延長作業繳交期限, 書面報告取代口頭報告, 口頭報告取代書面報告, 個人報告取代團體報告
考試形式
延後期末考試日期(時間), 書面(口頭)報告取代考試, 考試取代書面(口頭)報告
其他
由師生雙方議定
課程進度
週次
日期
單元主題
無資料